<匯港通訊> 内媒消息,昨日阿里通義實驗室開源R1-Omni模型,即業界首個將具有可驗證獎勵的強化學習(RLVR)應用於全能多模態大語言模型。研究人員利用RLVR對開源Omni模型HumanOmni-0.5B進行優化,在推理能力、情緒辨識準確度和泛化能力三個關鍵方面顯著提高了其效能。 R1-Omni能夠更清楚地理解視覺和聽覺訊息如何促進情緒識別,能夠明確地展示哪些模態訊息對特定情緒的判斷起到了關鍵作用。 (CW)